iT邦幫忙

2024 iThome 鐵人賽

DAY 21
0
佛心分享-IT 人自學之術

走在Pandas資料操縱與分析的路上持續前進系列 第 21

DAY21 Pandas使用concat合併part2 (DataFrame結構資料)

  • 分享至 

  • xImage
  •  

今天同樣也是要講解concat合併的應用,
主要針對DataFrame結構的資料來做合併。
同樣也會運用到昨天的知識,
不清楚的話還是可以回上一篇看看。

範例

這裡簡單建立兩個DataFrame結構的資料,
這裡刻意讓資料欄位不一致,
兩個欄位差異在City欄位的有無。

studentsData1 = {
    'studentId': ['001', '002', '003'],
    'Name': ['A', 'B', 'C'],
    'City': ['New York', 'Los Angeles', 'Chicago']
}
studentsData2 = {
    'studentId': ['004', '005', '006'],
    'Name': ['D', 'E', 'F'],
}
students1 = pd.DataFrame(studentsData1)
students2 = pd.DataFrame(studentsData2)
print(students1)
print(students2)

印出資料如下。
students1資料

  studentId Name         City
0       001    A     New York
1       002    B  Los Angeles
2       003    C      Chicago

students2資料

  studentId Name
0       004    D
1       005    E
2       006    F
合併資料

DataFrame結構資料的合併方式與Series結構資料相同,
複習一下,
語法pd.concat([資料1, 資料2], ignore_index=True)
將資料1及資料2做合併,
並將index數值重新排序,
使用方式如下。

students = pd.concat([students1, students2], ignore_index=True)
print(students)

印出資料如下。
這裡要注意的是資料欄位就算沒有對齊,
仍然可以做合併,
而沒有的欄位資料則會掛上NaN(Not a Number)。

  studentId Name         City
0       001    A     New York
1       002    B  Los Angeles
2       003    C      Chicago
3       004    D          NaN
4       005    E          NaN
5       006    F          NaN

今日結語

今天進一步的使用DataFrame結構的資料來做合併,
可以看出欄位在合併上是具有彈性的,
如此一來便可將不同的資料做合併後再統一做資料處理,
以利後續的資料分析。


上一篇
DAY20 Pandas使用concat合併part1 (Series結構資料)
下一篇
DAY22 Pandas修改資料
系列文
走在Pandas資料操縱與分析的路上持續前進30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言